我们提出了高度可行的帕累托优化(HIPPO) - 批处理采集功能,可实现多目标贝叶斯优化方法有效利用并行处理资源。多目标贝叶斯优化(MOBO)是解决昂贵的黑盒问题的非常有效的工具。但是,大多数主板算法被设计为纯粹的顺序策略,而现有的批次方法对于除最小的批量尺寸以外的所有人都非常昂贵。我们表明,通过通过以相似的预测目标值进行惩罚评估来鼓励批处理多样性,Hippo可以便宜地建立大量的信息观点。我们广泛的实验验证表明,河马至少与现有替代方案一样有效,同时产生的计算开销较低,并易于扩展到比文献中目前支持的批次大小要高得多。此外,我们证明了河马在充满挑战的热交换器设计问题上的应用,这强调了我们高度可行的MOBO方法的现实效用。
translated by 谷歌翻译
稀疏的高斯工艺是高通量贝叶斯优化(BO)循环的关键组成部分 - 越来越普遍的设置,评估预算大且高度平行。通过使用可用数据的代表性子集来构建近似后代,稀疏模型通过依靠一组较小的伪观察(即所谓的诱导点)代替完整的数据集来大大降低替代建模的计算成本。但是,当前设计诱导点的方法在BO循环中不合适,因为它们试图减少目标函数的全球不确定性。因此,牺牲了精确优化所需的有前途和数据密集区域的高保真模型,而是牺牲了计算资源,而是浪费在已经已知的亚地区的空间的建模区域上。受基于熵的BO方法的启发,我们提出了一种新颖的诱导点设计,该设计使用原则的信息理论标准选择诱导点。通过选择诱导点以最大程度地降低目标函数最大值的全局不确定性和不确定性,我们构建了能够支持高精度高通量BO的替代模型。
translated by 谷歌翻译
可拍照的分子显示了可以使用光访问的两个或多个异构体形式。将这些异构体的电子吸收带分开是选择性解决特定异构体并达到高光稳态状态的关键,同时总体红色转移带来的吸收带可以限制因紫外线暴露而限制材料损害,并增加了光疗法应用中的渗透深度。但是,通过合成设计将这些属性工程为系统仍然是一个挑战。在这里,我们提出了一条数据驱动的发现管道,用于由数据集策划和使用高斯过程的多任务学习支撑的分子照片开关。在对电子过渡波长的预测中,我们证明了使用来自四个Photoswitch转变波长的标签训练的多输出高斯过程(MOGP)产生相对于单任务模型的最强预测性能,并且在操作上超过了时间依赖时间依赖性的密度理论(TD) -dft)就预测的墙壁锁定时间而言。我们通过筛选可商购的可拍摄分子库来实验验证我们提出的方法。通过此屏幕,我们确定了几个图案,这些基序显示了它们的异构体的分离电子吸收带,表现出红移的吸收,并且适用于信息传输和光电学应用。我们的策划数据集,代码以及所有型号均可在https://github.com/ryan-rhys/the-photoswitch-dataset上提供
translated by 谷歌翻译
Deep learning semantic segmentation algorithms have provided improved frameworks for the automated production of Land-Use and Land-Cover (LULC) maps, which significantly increases the frequency of map generation as well as consistency of production quality. In this research, a total of 28 different model variations were examined to improve the accuracy of LULC maps. The experiments were carried out using Landsat 5/7 or Landsat 8 satellite images with the North American Land Change Monitoring System labels. The performance of various CNNs and extension combinations were assessed, where VGGNet with an output stride of 4, and modified U-Net architecture provided the best results. Additional expanded analysis of the generated LULC maps was also provided. Using a deep neural network, this work achieved 92.4% accuracy for 13 LULC classes within southern Manitoba representing a 15.8% improvement over published results for the NALCMS. Based on the large regions of interest, higher radiometric resolution of Landsat 8 data resulted in better overall accuracies (88.04%) compare to Landsat 5/7 (80.66%) for 16 LULC classes. This represents an 11.44% and 4.06% increase in overall accuracy compared to previously published NALCMS results, including larger land area and higher number of LULC classes incorporated into the models compared to other published LULC map automation methods.
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
在各地文化建造的知识使人类远远超过一个人可以从自己的一生中获集自己的经验。文化知识依次依赖语言:语言是之前几代相信,有价值和实践的最富有的记录,以及这些随着时间的推移如何进化。然而,语言作为文化学习手段的力量和机制并不充分了解,因此,当前的AI系统不会利用语言作为文化知识传输的手段。在这里,我们通过语言迈向逆向工程文化学习的第一步。我们以极简主义风格的视频游戏形式开发了一套复杂的任务,我们部署在迭代学习范式中。人类参与者仅限于只有两次尝试(两个生命)来击败每场比赛,并被允许向未来参与者写一条消息,在播放之前阅读消息。知识逐渐累积,允许后代在游戏中进一步推进并执行更有效的行动。多铸铁学习遵循一个独立的轨迹,对个人学习单独学习,无限数量的生命。通过表达自然语言中的不同类型的知识,连续几代学习者能够成功:环境的动态,有价值的目标,危险的风险和成功策略。我们在这里的视频游戏范式是一种丰富的试验台,用于开发能够获取和传递文化知识的AI系统。
translated by 谷歌翻译
人工推理通常可以理解为两个系统之间的相互作用:直观和关联(“系统1”)和审议和逻辑(“系统2”)。神经序列模型 - 在执行复杂,结构化任务时越来越成功 - 表现出系统1的优点和故障模式:它们是快速和学习数据的模式,但通常不一致和不连贯。在这项工作中,我们通过添加系统2-Inspired逻辑推理,寻求一种轻量级,无培训的手段来改善现有系统1样序列模型。我们探讨了该主题的几种变体,其中通过符号推理模块检查来自神经序列模型的候选几代,可以通过符号推理模块来接受或拒绝几代人。我们的方法使用神经推理来介导神经系统1和逻辑系统2.导致强大的故事生成和接地的指示,表明这种方法可以增加神经基代的一致性和准确性。
translated by 谷歌翻译
抽象和推理语料库(ARC)是一组用于测试代理人灵活解决新颖问题的能力的程序任务。虽然大多数弧任务对于人类来说很容易,但它们对最先进的AI有挑战性。是什么让建筑物智能系统概括到新颖的情况,例如arc困难?我们可以通过研究\ emph {语言}的差异来找到答案:虽然人类在容易地生成和解释了一般语言中,计算机系统被束缚到他们可以精确执行的狭窄域的语言。我们呈现LARC,The \ Texit {语言完整的ARC}:一组人类参与者的一系列自然语言描述,这些人参与者在如何使用单独的语言解决acc任务,其中包含88 \%的成功说明弧任务。我们将收集的指示分析为“自然程序”,发现当他们类似于计算机程序时,它们以两种方式截然不同:首先,它们含有各种基元;其次,他们经常利用直接可执行代码超出交际策略。我们证明这两个区别防止了当前的程序合成技术利用LACC到其全部潜力,并提供有关如何构建下一代程序合成器的具体建议。
translated by 谷歌翻译
来自高斯过程(GP)模型的汤普森采样(TS)是一个强大的工具,用于优化黑盒功能。虽然TS享有强烈的理论担保和令人信服的实证性能,但它会引发大量的计算开销,可通过优化预算进行多项式。最近,已经提出了基于稀疏GP模型的可扩展TS方法来增加TS的范围,使其应用​​于足够多模态,嘈杂或组合需要的问题,以便要求解决超过几百个评估。但是,稀疏GPS引入的近似误差使所有现有的后悔界限无效。在这项工作中,我们对可扩展Ts进行了理论和实证分析。我们提供理论担保,并表明可以在标准TS上遗憾地享受可扩展TS的计算复杂性的急剧下降。这些概念索赔是针对合成基准测试的可扩展TS的实际实施,作为现实世界的高通量分子设计任务的一部分。
translated by 谷歌翻译
贝叶斯优化(BO)被广泛用于优化随机黑匣子功能。尽管大多数BO方法都集中在优化条件期望上,但许多应用程序都需要规避风险的策略,并且需要考虑分配尾巴的替代标准。在本文中,我们提出了针对贝叶斯分位数和预期回归的新变异模型,这些模型非常适合异形的噪声设置。我们的模型分别由有条件分位数(或期望)的两个潜在高斯过程和不对称可能性函数的比例参数组成。此外,我们提出了基于最大值熵搜索和汤普森采样的两种BO策略,这些策略是针对此类型号量身定制的,可以容纳大量点。与现有的BO进行规避风险优化的方法相反,我们的策略可以直接针对分位数和预期进行优化,而无需复制观测值或假设噪声的参数形式。如实验部分所示,所提出的方法清楚地表现出异质的非高斯案例中的最新状态。
translated by 谷歌翻译